نقشه برداری ویژگی با استفاده از شبکه باور عمیق برای تشخیص گفتار قوی

نویسندگان

mojatba gholmipour

msc in artificial intelligence from the school of computer engineering university of technology, tusi babak nasersharif

assistant professor department of computer engineering, k.n.toosi university of technology.

چکیده

کارآیی سیستمهای بازشناسی گفتار خودکار در شرایط نویزی بخاطر عدم تطابق میان شرایط اموزش و آزمایش به شدت کاهش می یابد. روشهای متعدی برای رفع این عدم تطابق پیشنهاد شده اند. در سالهای اخیر شبکه های عصبی عمیق به طرز گسترده ای در سیستمهای بازشناسی گفتار و نیز در مقاوم سازی آنها و استخراج ویژگیهای مقاوم گفتار مورد استفاده قرار گرفته اند. در این مقاله، پیشنهاد می شود که از شبکه باور عمیق به عنوان یک رروش پس پردازش برای جبران اثر نویز بر روی ویژگیهای مل کپستروم استفاده شود.علاوه بر این از شبکه باور عمیق برای استخراج ویزگیهای آبشاری (احتمالات پسین وقوع واجها) از ضرایب حذف نویز شده مل گپستروم استفاده شده است تا ویزگیهای مقاوم تر و متمایزسازتری حاصل گردد. بردار ویزگی مقاوم نهایی شامل ویزگیهای مل کپستروم حذف نویز شده و ویژگیهای ابشاری ذکر شده است. نتایج ارزیابی بر روی دادگان گفتاری aurora 2 نشانگر ان است که بردار ویژگی پیشنهادی بهتر ازویژگیهای متداول و مشابه آن عمل می کند، طوری که دقت بازشناسی را نسبت به ویژگیهای مل کپستروم 28% افزایش می دهد.

برای دانلود باید عضویت طلایی داشته باشید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

تشخیص حالت‌های احساسی مبتنی بر EEG با استفاده از شبکه یادگیری عمیق

یکی از راه‌های ارتباط انسان و کامپیوتر بر پایه‌ی شناخت احساسات است. در این مقاله، مساله تشخیص احساسات با استفاده از سیگنال الکتروانسفالوگرام (EEG) مورد توجه قرار گرفته و در آن، با توجه به خاصیت غیرایستایی EEG، با استفاده از تجزیه مد تجربی (EMD)، توابع مد ذاتی (IMF) استخراج شده و سپس ۳ IMF اول انتخاب می‌شود. هر IMF با پنجره‌ یک ثانیه‌ای تبدیل به تکه‌های کوچکتری می‌شود و از هر قسمت ویژگی توان است...

متن کامل

تشخیص احساس ازسیگنال گفتار با استفاده از موجک بیونیک

تشخیص احساس برای رایانه امری چالش‌برانگیز است. دلیل اصلی این موضوع نیز عدم توانایی رایانه در درک احساس کاربر است. هدف از این مقاله، طراحی یک سیستم تشخیص احساس از گفتار و ارائة روشی نوین جهت بهبود این سیستم است. تاکنون در این زمینه از ویژگی‌های متفاوتی استفاده شده است، اما هیچ یک عملاً به ارتباط بین دامنة صوت و حالت‌های احساسی نپرداخته‌اند. چون موجک بیونیک به این ارتباط بیشتر پرداخته است، به‌نظر ...

متن کامل

انتخاب گیرنده GPS برای مقاصد نقشه برداری

همان اندازه که دوری جستن از تکنولوژی نوین نادرست می­ نماید، گرایش شتاب زده و بدون آگاهی و شناخت کامل به سمت خرید انواع وسایل پیشرفته، عملی نکوهیده است. بدیهی است که نقشه­ بردارای نیز می ­بایست خود را با پیشرفت های جدید سازگار ساخته و مجهز به وسایل پیشرفته گردند. اما چه بهتر که این عمل را با آگاهی و شناخت کامل از جوانب مختلف آن انجام دهند، تا میهن عزیزمان در آینده دچار عواقب و مشکلات انتخاب عجو...

متن کامل

تشخیص حس وابسته به گویندة گفتار فارسی با استفاده از ویژگی های آکوستیکی

بیان احساس در ارتباطات روزمره از جایگاه ویژه ای برخوردار است. از جمله بسترهای نمود احساس، گفتار است. از این رو، یکی از جنبه های مهم در طبیعی سازی ارتباط میان انسان و ماشین، تشخیص حس گفتار و تولید بازخورد متناسب با احساس درک شده است. باوجود پیشرفت های گسترده در حوزة پردازش گفتار، استخراج و درک احساس پنهان در گفتار انسان، همچون خشم، شادی و جز این ها، از یک سو و تولید گفتار احساسی مناسب از سوی دیگ...

متن کامل

روشی جدید به منظور بهینه سازی شبکه نقشه برداری

این مقاله راجع به تعیین ماتریس وزن مشاهدات از طریق ماتریس وریانس کووریانس مختصات است. در این مقاله روش جدیدی ارائه شده که می­ تواند بر مشکل طراحی «ماتریس معیار مناسب» قایق آید. این روش شبیه سرشکنی کمترین مربعات مشاهدات نقشه ­برداری است، و برحسب اهداف شبکه ­های کنترل، قادر است دقت مورد نیاز را تحت شرایط عملی بوجود آورد، یعنی تأمین دقت طرح با حداقل امکانات یا طراحی مطمئن همراه با دقت مورد درخواست...

متن کامل

تشخیص حس وابسته به گوینده گفتار فارسی با استفاده از ویژگی های آکوستیکی

بیان احساس در ارتباطات روزمره از جایگاه ویژه ای برخوردار است. از جمله بسترهای نمود احساس، گفتار است. از این رو، یکی از جنبه های مهم در طبیعی سازی ارتباط میان انسان و ماشین، تشخیص حس گفتار و تولید بازخورد متناسب با احساس درک شده است. باوجود پیشرفت های گسترده در حوزه پردازش گفتار، استخراج و درک احساس پنهان در گفتار انسان، همچون خشم، شادی و جز این ها، از یک سو و تولید گفتار احساسی مناسب از سوی دیگ...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید


عنوان ژورنال:
مهندسی برق مدرس

جلد ۱۴، شماره ۳، صفحات ۲۴-۳۰

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023